近年來,已經發表了超過 28,000 篇關于圖形驅動數據科學的同行評審科學論文。但是,獲得圖數據科學的好處不再僅限于科學家和財力雄厚的人。該技術揭示了上下文數據連接,為智能系統提供動力并增強機器學習預測。
谷歌是最早使用基于圖表的頁面排名來徹底改變搜索引擎的公司之一。現在,圖形技術的使用量呈指數級增長。隨著公司尋求從數據中獲得最佳見解,對圖形數據科學的興趣與人工智能和機器學習重疊。
圖形數據科學可以通過圖形算法推斷每條數據的連接上下文的“形狀”,從而實現卓越的機器學習建模。圖形數據科學讓企業可以在許多不同的情況下進行預測,從欺詐檢測到跟蹤客戶或患者的旅程。它可以幫助公司從用戶旅程中學習,為未來的購買提供準確的建議,并得到購買歷史證據的支持,以建立對建議的信心。知識圖譜也被用于識別基因和疾病之間的新關聯,發現新藥。
分析公司 Gartner 已將圖形數據科學確定為關鍵的數據和分析技術趨勢。當被問及人工智能和機器學習的使用情況時,92% 的公司表示計劃在五年內采用圖形技術。Gartner 認為,四分之一的全球財富 1000 強公司將在三年內建立技能基礎,并將利用圖形技術作為其數據和分析計劃的一部分。
中央的圖形技術
圖形技術正在政府高層使用。數據科學家 Felisia Loukou 和 Matthew Gregory 博士在圖形技術的幫助下部署了他們的第一個機器學習模型,根據他們正在訪問的頁面向 GOV.UK 用戶推薦內容。
科學家們解釋說,他們的應用程序學習了圖形節點的連續特征表示,然后可用于機器學習任務,例如推薦內容。他們指出,為模型的訓練和部署創建必要的數據基礎設施是最耗時的部分。
圖表技術推動營銷
即使對于網站的臨時訪問者,圖形技術也有助于識別正確的內容。媒體和營銷服務公司 Meredith 的高級數據科學家 Ben Squire 使用圖形算法將數十億的頁面瀏覽量轉換為具有豐富瀏覽配置文件的數百萬個假名標識符。他說:“向在線用戶提供相關內容,即使是那些沒有進行身份驗證的用戶,這對我們的業務至關重要。我們現在不再是‘在黑暗中做廣告’,而是更好地了解我們的客戶,這轉化為顯著的收入增長和更好的消費者服務。”
支持醫療供應鏈
圖數據科學也在支持醫療供應鏈。醫療設備制造商波士頓科學公司正在使用圖形數據科學來確定產品故障的原因。多個團隊,通常位于不同的國家,經常并行處理相同的問題。然而,工程師不得不求助于分析電子表格中的數據,導致不一致,最重要的是,難以找到缺陷的根本原因。
波士頓科學公司建立了一個由三個節點組成的圖形數據模型,其關系可以追蹤故障到零件并將其連接到成品。分析查詢時間更快,有助于提高整體效率并簡化整個分析過程。該公司現在可以識別更有可能出現故障的特定組件。另一個好處是,由于圖數據模型非常簡單,因此很容易與他人交流。“參與該項目的每個人,從業務利益相關者到技術實施者,都能夠相互理解,因為他們都說一種共同的語言,”該公司的數據科學家 Eric Wespi 證實。
促進健康結果
在醫療保健領域,紐約長老會醫院的分析團隊正在使用圖形數據科學來跟蹤感染并采取行動控制感染。醫院希望記錄每一個事件,從患者入院到他們接受的所有測試以及最終出院。圖形數據科學提供了一種靈活的方式來連接事件的所有維度——事件發生的內容、時間和地點。
該團隊創建了一個“時間”樹,然后創建了一個“空間”樹來模擬所有患者可以在現場接受治療的房間。這個初始模型揭示了大量的相互關系。為了在此基礎上進行構建,包含了一個事件實體來連接時間樹和位置樹。生成的數據模型允許分析團隊分析其設施中發生的一切。
這些例子只是圖數據科學可能性的一小部分嘗試。圖形技術與預測性人工智能和機器學習計劃齊頭并進,并將成為企業數據分析的關鍵支柱。